🦊Ideogram 4.0

👈 |

👉 |

モデルのダウンロード

diffusion_models

https://huggingface.co/Comfy-Org/Ideogram-4/blob/main/diffusion_models/ideogram4_fp8_scaled.safetensorsideogram4_fp8_scaled.safetensors (9.28 GB)

https://huggingface.co/Comfy-Org/Ideogram-4/blob/main/diffusion_models/ideogram4_nvfp4_mixed.safetensorsideogram4_nvfp4_mixed.safetensors (5.49 GB)

https://huggingface.co/Comfy-Org/Ideogram-4/blob/main/diffusion_models/ideogram4_unconditional_fp8_scaled.safetensorsideogram4_unconditional_fp8_scaled.safetensors (9.28 GB)

https://huggingface.co/Comfy-Org/Ideogram-4/blob/main/diffusion_models/ideogram4_unconditional_nvfp4_mixed.safetensorsideogram4_unconditional_nvfp4_mixed.safetensors (5.49 GB)

text_encoders

https://huggingface.co/Comfy-Org/Ideogram-4/blob/main/text_encoders/qwen3vl_8b_fp8_scaled.safetensorsqwen3vl_8b_fp8_scaled.safetensors (10.6 GB)

vae

https://huggingface.co/Comfy-Org/Ideogram-4/blob/main/vae/flux2-vae.safetensorsflux2-vae.safetensors (336 MB)

code:models

📂ComfyUI/

└── 📂models/

├── 📂diffusion_models/

│ ├── ideogram4_fp8_scaled.safetensors

│ ├── ideogram4_nvfp4_mixed.safetensors

│ ├── ideogram4_unconditional_fp8_scaled.safetensors

│ └── ideogram4_unconditional_nvfp4_mixed.safetensors

├── 📂text_encoders/

│ └── qwen3vl_8b_fp8_scaled.safetensors

└── 📂vae/

└── flux2-vae.safetensors

モデルを2つ使うので VRAMがキツイ

unconditionalの方は nvfp4でも特に問題ないので、fp8(conditional) + nvfp4(unconditional) の組み合わせが良いかもしれない

プロンプトについて

既定のJSONスキーマに従わないとまともにクオリティを出せない。基本形は以下

code:prompt.json

{

"high_level_description": "画像全体の1〜2文の説明。",

"style_description": {

"aesthetics": "雰囲気、審美性。",

"lighting": "ライティング。",

"medium": "illustration / photograph / graphic_design など。",

"art_style": "非写真の場合の画風。",

"color_palette": "#FFFFFF", "#000000"

"compositional_deconstruction": {

"background": "背景・環境の説明。",

"elements": [

{

"type": "obj",

"bbox": 100, 200, 800, 700,

"desc": "物体・人物・要素の説明。",

"color_palette": "#FFFFFF", "#000000"

{

"type": "text",

"bbox": 820, 200, 920, 800,

"text": "HELLO",

"desc": "文字の見た目の説明。",

"color_palette": "#000000"

}

]

}

ただし、こんなものを手で書いてはいられないので以下の方法を使うことになる(と思う)

専用プロンプトビルダーを使う

ComfyUI-KJNodesのIdeogram 4 Prompt Builder KJノードがよく使われている

LLMに任せる

https://github.com/ideogram-oss/ideogram4/blob/main/docs/prompting.md公式プロンプトガイドと画像や下書き・自然文での指示をLLMに投げて、json形式で答えてもらう

e.g. https://chatgpt.com/share/6a28f7cc-e934-8320-86d6-f790a5274389

ただ、ComfyUI上で動かせるレベルのモデルだと性能が足りないので、大人しくChatGPTなどに投げたほうが良いとは思う

text2image

https://gyazo.com/c9a2cf1717e87cd1ba28c5d236a02b4d

Ideogram_4.0_text2image.json